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Метод оптимизации на основе моделирования 
перемещения бактерий для решения задачи 
отбора информативных признаков 

при построении распознающих моделей 


Решена задача автоматизации поиска наиболее информативной комбинации признаков. Предложен 
метод отбора информативных признаков на основе моделирования перемещения бактерий. Проведены 
эксперименты по выделению набора информативных признаков для синтеза распознающих моделей 
хронического бронхита. 


Введение 


Одним из новейших направлений искусственного интеллекта являются мульти- 
агентные методы интеллектуальной оптимизации, имеющие бионическую природу, 
которые моделируют поведение живых существ, характеризующихся коллективным 
интеллектом [1]. 

К мультиагентным методам интеллектуальной оптимизации относятся: метод 
муравьиных колоний, метод пчелиной колонии, метод оптимизации с группировкой 
частиц и др. Данные методы уже нашли широкое применение при решении различ- 
ных задач оптимизации [2-6]. 

Одним из наименее изученных на сегодняшний день методов интеллектуальной 
оптимизации является метод оптимизации на основе моделирования перемещения 
бактерий (Васепа Еогасше Орйпиайоп, ВЕО), возможности которого ещё не до 
конца исследованы. В связи с этим актуальной является разработка новых методов 
оптимизации на основе моделирования перемещения бактерий. 

Построение моделей сложных объектов и процессов является крайне важной 
задачей, часто возникающей на практике. При решении задачи моделирования осо- 
бенно для объектов, характеризующихся многомерностью, необходимо выполнить 
отбор информативных признаков, позволяющий снизить избыточность создаваемых 
моделей. Для решения задачи отбора информативных признаков предложен ряд ме- 
тодов, основанных на полном или сокращённом переборе [7], которые при больших 
выборках данных работают слишком долго. Поэтому разработка новых методов, поз- 
воляющих решать задачу отбора информативных признаков, является весьма актуальной. 

Поскольку метод оптимизации на основе моделирования перемещения бактерий 
является новым и весьма перспективным методом поиска, а также ещё не применялся 
для решения данной задачи, то целью настоящей работы является создание метода 
отбора информативных признаков на основе моделирования перемещения бактерий. 


278 «Искусственный интеллект» 12009 


Метод оптимизации на основе моделирования перемещения бактерий... 


6-О 


Метод оптимизации на основе 
моделирования перемещения бактерий 
(Вацепа Еогасте Орйпттайоп, ВЕО) 


Метод ВЕО основан на моделировании поведения бактерии Е. Сой [8-10]. Способ- 
ность бактерии Е. Со| двигаться обеспечивается за счёт шести или более жгутиков, 
которые вращаются с частотой 100 -— 200 оборотов в секунду, каждый из которых 
управляется с помощью своего собственного биологического «мотора». 

Хемотаксис — это двигательная реакция бактерии в ответ на появление в среде 
аттрактанта (аттрактант — вещество, привлекающее бактерии) или репеллента (репел- 
лент — вещество, отпугивающее бактерий) [11], [12]. В естественных условиях аттрак- 
тантами являются вещества, полезные для бактерий, а репеллентами — те, которые 
бактериям вредны. 

Метод ВРО [13] предназначен для нахождения минимума функции ХХ), ХЕ? 
при неизвестном градиенте У.ДХ), где Х — позиция бактерии в пространстве поиска 
ЕР, а с помощью 0) моделируются полезные и вредные свойства среды. Таким 
образом, „7 <0, „Л = 0, /> 0 означает, что бактерия находится в полезной, нейтральной и 
вредной среде соответственно. Пусть РС}, К, 1) = {Х(, К, 1), 1=1,2,..., 5} описывает 
позицию каждого члена популяции 5 бактерий на /-м хемотаксическом шаге, А-м ша- 
ге воспроизведения и на /-м событии исключения — рассеивания. 

Пусть 4нгас — глубина аттрактанта (полезных веществ) клетки И Изигас — мера 
ширины аттрактанта. Пусть Йгерепаг: = @аитас! — Высота вредного вещества (репеллент) и 
Илеренак — Мера ширины репеллента. Таким образом, можно использовать функции 
ый ес (Х), т = 1,2, ..., 9 для моделирования сигналов между клетками посредством 
выделения бактериями аттрактанта и репеллента [14]: 


КУ 5 р 5 Р 
Ле (Х) = 2 — р — Чотас Хр] — Уна: СО -х,’ +». Перепен ехр| - Же -х,’ , 
= = ри = 12 
тех =... х]" — точка в пространстве оптимизации. 

Очевидно, что сила выделения химических веществ бактериями зависит от 
окружающей среды, т.е. бактерия, находящаяся в среде с высокой концентрацией 
полезных веществ, будет выделять более сильный аттрактант, чем та же бактерия в 
области с низкой концентрацией полезных веществ. Поэтому в данном методе 
используется функция ./.,(0) для моделирования взаимодействия между ячейками с 
учётом особенностей окружающей среды: „Л„(Х) = ехр(М — ЛХ)).Ле(Х), где М - настраи- 
ваемый параметр. Следовательно, для поиска оптимума необходимо минимизировать 
выражение (ДЕ, /, К, 1) + Л„(Х(, К, 1))), что позволяет бактериям искать полезные 
вещества, избегая областей с вредными веществами, и в то же время приближаясь к 
другим ячейкам, но не слишком близко к ним. 

Тогда работу метода оптимизации на основе моделирования перемещения бак- 
терий [13], [15] можно представить в виде последовательности шагов 1 - 14. 

Шаг 1. Инициализация. Задать параметры метода: 5 — количество бактерий, №. — 
количество шагов воспроизведения, №, — количество шагов-повторений на одном 
хемотаксическом шаге, № — количество хемотаксических шагов, №4 — количество 
событий исключения-рассеивания; Ре — вероятность рассеивания. Случайным образом 
распределить начальные значения АХ", {= 1, 2, ..., 5 по пространству поиска. Рассчи- 
тать начальные значения целевой функции для каждой бактерии „Л. Для каждой 
бактерии выполняется пересчёт: Л =.Л + ЛХ). 
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Шаг 2. Установить: /= [+ 1. 

Шаг 3. Установить: А = А+ 1. 

Шаг 4. Установить: / = 7 1. 

Шаг 5. Для каждой бактерии моделируется хемотаксис: кувыркание, перемеще- 
ние и скольжение (шаги 5.1 — 5.5). 

Шаг 5.1. Установить: 1= 1+ 1. 

Шаг 5.2. Кувыркание. Моделирование кувыркания достигается за счёт генера- 
ции вектора случайных чисел 0(]) Е &?: 

А 


МАГДА 
где Д - вектор случайных чисел в интервале [-1; 1]. 


Вектор ф представляет собой множество длин для соответствующих измерений. 
Шаг 5.3. Перемещение. Рассчитывается новое положение 1-й бактерии по формуле: 


х0+160=Х0,60+С00, 
где С(?) > 0 - размер шага в определённом направлении, позволяющий моделировать 
процесс кувыркания. 

Для новой позиции Х"(7 + 1, К, 1) рассчитывается соответствующее значение це- 
левой функции „ЛЬ, / + 1, А, /). Установить: ЛЬ] + 1, &, ) = ЛЬ +1, ЮЛЮ 0). 
Если ЛЬ, / + 1, К, / < Льезь тогда установить: Лех = ЛЬ] + 1, К, 0), Хи = (+ К, 0. 

Шаг 5.4. Скольжение. Если в позиции № (7+1, К, [) значение ЛЬ, 7 + 1, К, [) лучше, 
чем в позиции АХ" (7, К, 1), то есть выполняется условие: ЛЕ, / + 1, К, [) < ЛЬ}, &, 1, тогда 
производится следующий хемотаксический шаг с тем же вектором фи в том же 
направлении (переход к шагу 5.3), и такое повторение может повторяться №, раз. 
Если условие не выполняется, то переход к шагу 5.5. 

Шаг 5.5. Если 1 < 5, то переход к шагу 5.1, в противном случае — переход к шагу 6. 

Шаг 6. Если] < №, то переход к шагу 4, в противном случае — переход к шагу 7. 

Шаг 7. Воспроизведение. Менее здоровые бактерии умирают, а остальные, бо- 
лее здоровые, разделяются на две бактерии, при этом новые бактерии размещаются в 
ту же самую точку пространства поиска. 

Шаг 8. Если А < М,е, тогда выполняется переход к шагу 3, в противном случае — 
переход к шагу 9. 

Шаг 9. Исключение и рассеивание. Каждая бактерия с вероятностью Реал разме- 
щается в случайно выбранной точке пространства поиска. 

Таким образом, проверяется условие: (' < Ра», где И'- случайное число в ин- 
тервале [0; 1] для 1-й бактерии. Если данное условие выполняется, то бактерия поме- 
щается в позицию Х"(,, К, /), полученную случайным образом. 

Шаг 10. Если [< Ма, тогда выполняется переход к шагу 2, в противном случае — 
к шагу 11. 

Шаг 11. Выбирается и сохраняется лучшее решение „Ле, и соответствующая по- 
зиция Хъея, В КОТОрой достигается лучшее решение „Лье.г. 

Шаг 12. Проверка на окончание поиска. Если были выполнены все циклы для 
всех бактерий, то выполняется переход к шагу 14, в противном случае выполняется 
перезапуск — переход к шагу 13. 

Шаг 13. Перезапуск бактерий: выбираются новые случайные позиции для каж- 
дого агента Х ,1=1,2,..., 5, и рассчитываются соответствующие значения целевой 
функции Л,1=1,2,..., 5. Устанавливаются счётчики циклов: / =0, К=0, /=0. 

Шаг 14. Останов. 
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Метод оптимизации на основе моделирования перемещения бактерий приме- 
нялся для решения различных задач оптимизации: нахождения оптимального потока 
энергии [16], задачи динамического распределения ресурсов [14] и др. [17-19]. Резуль- 
таты проведенных экспериментов по решению тестовых задач [14], [16-19] показали, 
что применение метода является эффективным и весьма перспективным для решения 
практических задач, поскольку результаты, полученные с помощью данного метода, 
характеризовались более высокой или достаточной точностью по сравнению с тра- 
диционными методами. 


Отбор признаков на основе моделирования 
перемещения бактерий 


Задача отбора информативных признаков заключается в выборе такого набора 
признаков минимального размера, которые наиболее полно характеризуют изучаемый 
сложный объект или процесс, что позволяет избежать использования в распознающих 
моделях лишних признаков. 

Для решения задачи отбора информативных признаков на основе метода моде- 
лирования перемещения бактерий программные агенты, моделирующие поведение 
бактерий, должны осуществлять оптимизацию в пространстве поиска Х = (м1, Х›, ..., хм), 
х; = {0, 1}, где № — общее количество признаков, характеризующих выборку. Таким 
образом, каждая точка пространства поиска представляет собой битовую строку, 
координаты которой позволяют определить, считается ли признак информативным: 
информативным считается признак, если соответствующая координата равна 1, в про- 
тивном случае — признак считается неинформативным. В качестве целевой функции 
ХХ) предлагается использовать ошибку модели, построенной на основе признаков, 
которые являются информативными для данной точки пространства поиска. 

Для выполнения перемещения по такому пространству поиска величины, опре- 
деляющие процесс движения в пространстве поиска должны принимать следующие 
значения: 

— переменные, определяющие размер шага в определённом направлении, для 1-Й 
бактерии: С(Ф) Е (0; 1); 
— вектор случайных чисел на /-м шаге хемотаксиса: (7) = {—1, 0, +1}. 

Пример перемещения по пространству поиска из трёх признаков, если бактерия в 
начале поиска находилась в точке (0; 0; 0), вектор размера шага для данной бактерии 
С = (1; 1; 1), вектор случайных чисел на 1-м шаге хемотаксиса ф(1) = (1; 0; +1), а на 
2-м шаге (1) = (-1; +1; 0), приведен на рис. 1. 


Хз 


1:0) ®2 


Рисунок 1 — Пример перемещения в пространстве поиска из трёх признаков 
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Тогда метод оптимизации на основе моделирования перемещения бактерий для 
отбора информативных признаков может быть представлен в виде последователь- 
ности шагов 1 - 14. 

Шаг 1. Инициализация. Задать параметры метода: 5, № ь, №, №, № а Реа. Случай- 
ным образом распределить начальные значения Х', 1 = 1, 2, ..., 5 по пространству 
поиска. Рассчитать начальные значения целевой функции для каждой бактерии .Л. 
Для каждой бактерии выполнить пересчёт: Л = Л + .Л„(Х). 

Шаг 2. Установить: /= [+ 1. 

Шаг 3. Установить: А = А+ 1. 

Шаг 4. Установить: / = 7+ 1. 

Шаг 5. Моделирование хемотаксиса. 

Шаг 5.1. Установить: 1= 1+ 1. 

Шаг 5.2. Кувыркание и перемещение. 

Создаётся вектор С(Ф) = гапа(0; 1), где гапа(0; 1) — случайное действительное 
число в диапазоне [0; 1]. 

Генерация вектора случайных чисел (7) = гап4а_ ш(К-1; +1), где гапа_шК-Ь-1; +1) — 
случайное целое число в диапазоне [-1; +1]. 

Рассчитывается новое положение 1-й бактерии по формуле: 


если Х"(1,К,/) + С.Ф) > 
Х'(+ЬК, 1) = поипа(Х" (1,К,1) + С -Ф( Л), если 0 < Х"(,К,1) + С.Ф < В 
0, если Х'(/,^,)+С@:Ф(<0. 


Формула расчёта нового положения 1-й бактерии учитывает особенности зада- 
чи отбора признаков и обеспечивает постоянное нахождение агентов в необходимом 
пространстве поиска. 

Рассчитать значение целевой функции .Л®, ] + /, К, /). 

Установить: ДЕ] + 1, А, ) = .ЛЬУ+Ь К 0+ (0+1). . 

Если ЛЬ] + 1, К, 1) < Льезь тогда установить: „Лех = „ЛЬ, ] + 1, К, /), Хъеи= ^(+ 1, & 1. 

Шаг 5.3. Скольжение. Пока выполняется условие: „Да, 1, А, 1) < ЛЬ, К, 1, пов- 
торяется шаг 5.2. Такое повторение может повторяться М, раз. Если условие не вы- 
полняется, то переход к шагу 5.4. 

Шаг 5.4. Если 1 < 5, то переход к шагу 5.1, в противном случае — переход к шагу 6. 

Шаг 6. Если} < Ме, то переход к шагу 4, в противном случае — переход к шагу 7. 

Шаг 7. Воспроизведение. Используется такой же подход, как и в базовом методе 
оптимизации на основе моделирования перемещения бактерий: все бактерии сорти- 
руются в соответствии с полученными значениями целевой функции, после чего 
худшая половина бактерий отбрасывается, а лучшая — дублируется. 

Шаг 8. Если К < М», то выполняется переход к шагу 3, в противном случае — 
переход к шагу 9. . 

Шаг 9. Исключение и рассеивание. Проверяется условие: И' < Ра. . 

Если данное условие выполняется, то бактерия помещается в позицию А"(), (, /), 
полученную случайным образом. 

Шаг 10. Если [< Ма, то выполняется переход к шагу 2, в противном случае - к 
шагу 11. 

Шаг 11. Выбирается и сохраняется лучшее решение Ль.„ и соответствующая 
позиция Хьех. 

Шаг 12. Проверка на окончание поиска. Если были выполнены все циклы для 
всех бактерий, то выполняется переход к шагу 14, в противном случае выполняется 
перезапуск — переход к шагу 13. 
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Шаг 13. Перезапуск бактерий: выбираются новые случайные позиции для каж- 
дого агента р ,1=1,2,..., ©, рассчитываются соответствующие значения целевой 
функции Л, 1=1,2,..., 5. Счётчики циклов сбрасываются в 0: /= 0, = 0, [= 0. 

Шаг 14. Останов. 


Эксперименты и результаты 


Разработанный метод отбора признаков на основе моделирования перемещения 
бактерий был программно реализован на языке пакета МаЙаБ. Для проверки эффектив- 
ности применения предложенного метода и разработанного программного обеспечения 
решалась задача отбора информативных признаков для синтеза моделей в задачах 
диагностики хронического бронхита [20]. 

Для построения распознающих моделей использовалась экспериментально по- 
лученная выборка данных исследований функционально-морфологических свойств 
лейкоцитов и тромбоцитов, сосудистого фактора, системы комплемента и циркули- 
рующих иммунных комплексов (ЦИК) периферической крови 205 пациентов. 

Анализировалось состояние 28 диагностических признаков: х! — пол, Х› — возраст, 
хз — содержание лейкоцитов, в том числе: х4 — палочкоядерных, х5 — сегментоядер- 
ных, хб — эозинофилов, х7 — моноцитов, хз — лимфоцитов, хо — фагоцитарное число 
нейтрофилов, х!о — фагоцитарное число моноцитов, хи! — фагоцитарный индекс нейт- 
рофилов, х!12 — фагоцитарный индекс моноцитов, х1з — индекс завершенности фагоци- 
тоза нейтрофилов, х!4 — индекс завершенности фагоцитоза моноцитов, х!5 — НСТ- 
тест, отражающий способность нейтрофилов генерировать активные формы кислорода; 
х!6 — процент НСТ-положительных нейтрофилов, х!7 — НСТ-стимулированный - от- 
ражает резервные возможности нейтрофилов генерировать активные формы кислорода 
в условиях их дополнительного стимулирования, х1з — процент НСТ-положительных 
нейтрофилов, реагирующих на стимулирование; х!э — количество тромбоцитов, хо — 
количество зрелых тромбоцитов, х›! — количество активных тромбоцитов, х22 — 
уровень комплемент (СН.5о), х›з — уровень ЦИК, осаждаемых 3 % полиэтиленглико- 
лем (ПЭГ), х24 — уровень ЦИК, осаждаемых 4 % ПУЭГ, хо5 — размер ЦИК, х»к — актив- 
ность миелопероксидазы нейтрофилов, хо7 — активность катионных белков нейтрофилов, 
Х2з — уровень сосудистого фактора Виллебранда. 

Каждому экземпляру выборки было сопоставлено значение целевого параметра — 
диагноза соответствующего пациента (1 — болен, 0 — не болен). 

Выделение комбинации признаков выполнялось с использованием канонической 
модели генетического поиска и с помощью разработанного метода отбора информа- 
тивных признаков на основе моделирования перемещения бактерий. Значения пара- 
метров работы метода оптимизации на основе моделирования перемещения бактерий 
были следующими: 5=20; №. =4; №=4; №=20; №Мш=2; Реа= 0,25; акс = 0,1; 
У’аигасе — 0,2; ЙтореНани = Яонеасв УИТереПав — 10. 

В качестве целевой функции ХХ) использовалась среднеквадратическая ошибка 
классификации по двухслойной нейросети прямого распространения, синтезированной 
на основе признаков оцениваемой точки пространства поиска и содержащей 5 нейро- 
нов на первом слое и один нейрон на втором слое. Все нейроны имели логсигмоидную 
функцию активации, а в качестве дискриминантных функций -— взвешенные суммы. 

В результате экспериментов с помощью разработанного метода на основе мо- 
делирования перемещения бактерий было выделено 8 признаков (х2, Хз» Хо, Хо, Хи, 
х1з, Х19, Х22), в то время, как с помощью канонической модели генетического поиска, 
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было выделено 9 признаков (хб, Хэ, Х10, Х12, Хз, Х19, Х20, Х21, Х22). При этом ошибки мо- 
делей составили 0,0045 и 0,0063 для разработанного метода и канонической модели 
генетического поиска соответственно. Время работы методов незначительно отлича- 
лось в пользу предложенного метода. Количество циклов обучения составило 3336 и 
4200 для метода на основе моделирования перемещения бактерий и канонической 
модели генетического поиска соответственно. 

Значения весовых коэффициентов полученной нейронной сети представлены в 
табл. 1. 


Таблица 1 — Матрица весовых коэффициентов нейросетевой модели 


Номер | Номер нейрона Номер входа нейрона 
слоя в слое 0 1 2 3 4 ) 6 7 8 
1 12,383 |-29,38| 11,18 | 13,79 | 10,35 | -7,91 |-7,115| 29,81 |-13,765 
2 —29,77 | 5,531 |-39,11| 21,89 | 21,79 | -1,473 |-19,89| 17,57 | 39,053 
1 3 18,821 |-5,155|26,798 |-20,58 |4,1709 | 24,738 |-3,715 7,9964 | —49,53 
4 57,701 1112,73 |-497,4|-174,5 |241,16| 785,24 |-241,8|-422,2 |-508,85 
5 16,454 |-100,7|-13,24|35,465| 43,37 | 93,237 |-17,06|104,71 | 48,537 
2 1 —1677 |-1328 | 433,3 | 1768 | 85,8 | 1238,7 


Таким образом, можно сделать вывод, что применение метода отбора признаков 
на основе моделирования перемещения бактерий позволяет получить модель с большей 
точностью, с меньшим количеством признаков и быстрее по сравнению с классичес- 
кой моделью генетического поиска. 


Заключение 


В работе решена задача автоматизации отбора информативных признаков для 
синтеза эффективных моделей исследуемых объектов, процессов и систем с исполь- 
зованием оптимизации на основе моделирования перемещения бактерий. 

Научная новизна работы заключается в том, что впервые разработан метод 
отбора признаков на основе моделирования перемещения бактерий. В разработанном 
методе учитывается специфика решаемой задачи за счёт применения предложенной 
стратегии перемещения агентов в пространстве поиска, которая заключается в соот- 
ветствующем выборе параметров, влияющих на их перемещение, а также в ограни- 
чении пространства поиска. 

Практическая ценность результатов работы состоит в том, что разработано 
программное обеспечение, реализующее предложенный метод отбора признаков, а 
также решена задача выделения информативного набора признаков для синтеза рас- 
познающих моделей хронического бронхита. 

Исследование выполнено в рамках НИР «Научно-методические основы и мате- 
матическое обеспечение для автоматизации и моделирования процессов управления 
и поддержки принятия решений на основе процедур распознавания и эволюционной 
оптимизации в нейросетевом и нечеткологическом базисах» (№ гос. регистрации 


01060008621). 
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О.0. Олйник, С.О. Суббопин 

Метод оптимацй на основ! моделювання перемйцення бактерй для вир!шення задач! вдбору 
иформативних ознак при побудови розшзнаючих моделей 

Виришено завдання автоматизацй пошуку найбльш 1нформативно! комбнаци ознак. Запропоновано 
метод в1дбору 1нформативних ознак на основ! моделювання перемпцення бактерий. Проведено експерименти 
по видлленню набору 1нформативних ознак для синтезу розшзнаючих моделей хрон!чного бронх1ту. 


А.А. Феушй, 5.А. биББойпт 

Васема Еогаошо Орйпитайоп ог Ееабиге З@есйоп ог Весоошишто Моде! Сопзбгисйоп 

ТБе ащютайоп оЁ Ееавхе з@есйоп рго ет 1$ зо[уеа. Те Еабге зе]есНоп тефо4 Базе оп Бацепа КЮюгаете 
орипихайоп 1$ ргорозеа. Ехрегипеп$ оп аПосайоп оЁ шгтайуе еафиге зеЁ юг гесогп17те по4е]$ оЁ 
сВгошес Бгопс1$ уп ез1$ аге [еа4. 
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